wenet-StubbornHuang Blog

深度学习 – 语音识别框架Wenet网络设计与实现

转载自Wenet网络设计与实现，这个文章是Wenet团队对Wenet比较全面的介绍，也在很多地方解答了我在看wenet源码时的疑惑，会时不时翻出来再看的文章，但是这个文章是托管在Github上的，所以为了防止某些不可控的原因导致无法阅读原文，所以在本站对原文进行完整备份，仅用于个人阅读，如果原作者认…

StubbornHuang
深度学习
2023-01-13
2,604
1

深度学习 – 语音识别框架wenet中的CTC Prefix Beam Search算法的实现

1 Wenet中的CTC Prefix Beam Search Decode的实现下面是Wenet网络的流程图上图来自于：http://placebokkk.github.io/wenet/2021/06/04/asr-wenet-nn-1.html 语音特征数据在经过Encoder后会使用CT…

StubbornHuang
深度学习
2023-01-13
1,808
0

深度学习 – 语音识别框架中wenet最大动态chunk大小为什么取值为25？

1 原文论文在wenet的论文Unified Streaming and Non-streaming Two-pass End-to-end Model for Speech Recognition中的3.2.2节Dynamic Chunk Training中对动态chunk size有以下描述：…

StubbornHuang
深度学习
2022-09-01
4,834
0

深度学习 – 语音识别框架wenet的非流式与流式混合训练机制

1 wenet的非流式与流式混合训练机制 wenet实现了语音识别非流式与流式混合训练的机制。通过细读源码，其主要是通过动态修改网络的Encoder层（在wenet中主要使用了TransformerEncoder和Conformer）的attention mask来影响Encoder层中Self-A…

StubbornHuang
深度学习
2022-08-11
4,531
2

深度学习 – 语音识别框架wenet源码wenet/utils/mask.py中的mask机制

在阅读工业级语音识别框架wenet的源码的过程中，wenet/utils/mask.py中提供的各种mask函数非常重要，其实现了wenet论文Unified Streaming and Non-streaming Two-pass End-to-end Model for Speech Recog…

StubbornHuang
深度学习
2022-08-10
3,286
2

wenet

联系我

资助我们

深度学习 – 语音识别框架Wenet网络设计与实现

深度学习 – 语音识别框架wenet中的CTC Prefix Beam Search算法的实现

深度学习 – 语音识别框架中wenet最大动态chunk大小为什么取值为25？

深度学习 – 语音识别框架wenet的非流式与流式混合训练机制

深度学习 – 语音识别框架wenet源码wenet/utils/mask.py中的mask机制

wenet

联系我

资助我们

深度学习 – 语音识别框架Wenet网络设计与实现

深度学习 – 语音识别框架wenet中的CTC Prefix Beam Search算法的实现

深度学习 – 语音识别框架中wenet最大动态chunk大小为什么取值为25？

深度学习 – 语音识别框架wenet的非流式与流式混合训练机制

深度学习 – 语音识别框架wenet源码wenet/utils/mask.py中的mask机制

大家都在搜

关注我们的公众号